استخراج خودکار روابط رده بندی مفاهیم از متون بدون ساختار با استفاده از روش های هوشمند پردازش متن
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه بوعلی سینا - دانشکده مهندسی
- نویسنده حسین سبزیانی
- استاد راهنما محرم منصوری زاده محمد راسخ مهند
- سال انتشار 1392
چکیده
برای بدست آوردن روابط سلسله مراتبی در یک متن بدون ساختار، ابتدا به کمک روشهای هوشمند پردازش متن و استفاده از روابط معنایی، تمام عبارت هایی را که در متن نقش کلیدی دارند را استخراج میکنیم. هر کدام از این عبارت ها عضوی از گراف نهایی تولید شده ار متن خواهد بود. سپس با استفاده از الگوریتم خاصی به استخراج ابرنام(hypernym) هر یک از عبارت ها میپردازیم و به صورت بازگشتی این عمل تکرار می شود تا گراف روابط سلسله مراتبی کامل شود. در مراحل بعد به با استفاده وزن دهی یالهای گراف به هرس کردن گراف میپردازیم و تمام حلقه های گراف را از بین میبریم و نمودار نهایی به صورت درخت خواهد بود. در آخر ممکن است چون محتمل است که نمودار کمبود اطلاعات داشته باشد به بازیابی برخی از روابط هرس شده ی مفید میپردازیم.
منابع مشابه
رده بندی خودکار متون با استفاده از روش های هوش محاسباتی
با رشد چشم گیر استفاده از اینترنت، حجم اسناد متنی دیجیتال موجود نیز به صورت نمایی افزایش می یابد. از این رو، یافتن اطلاعات مفید از این اسناد متنی در کاربردهای بسیاری اهمیت پیدا کرده است که رده بندی خودکار متون، تکنولوژی کلیدی برای این منظور است. به ازای هر سند متنی، واژهها نقش ویژگی را در رده بندی ایفا می کنند که با توجه به حجم زیاد واژه در زبان طبیعی، این مسأله منجر به ایجاد مشکل ابعاد زیاد و...
بهبود خلاصه سازی خودکار متون فارسی با استفاده از روشهای پردازش زبان طبیعی و گراف شباهت
A significant amount of available information is stored in textual databases which contains a large collection of documents from different sources (such as news, articles, books, emails and web pages). The increasing visibility and importance of this class of information motivates us to work on having better automatic evaluation tools for textual resources. The automatic summarization of tex...
متن کاملاستخراج خودکار عبارتهای کلیدی از متون مقالههای فارسی
در پژوهش حاضر، عبارتهای کلیدی از متون مقالههای فارسی به صورت خودکار جداسازی گردیده است. استخراج عبارتها مبتنی بر روشهای آماری، نحوة توزیع واژگان، مجاورت و ... صورت پذیرفته است. سیستمی که بر پایه پژوهش حاضر طراحی گردیده، با توجه به بازخوردهای کاربر از قابلیت یادگیری برخوردار است، با توجه به بازخوردهای کاربر از قابلیت یادگیری برخوردار است، به گونهای که در طول زمان مرتباً به کارایی آن افز...
متن کاملمفاهیم مثلث بندی هوایی خودکار
اساس کار در فتوگرامتری رقومی، تصاویر رقومی است. با داشتن این تصاویر اندازه گیری اتوماتیک امکان پذیر خواهد بود. یکی از وظایف اصلی در مثلث بندی هوایی، اندازه گیری تصاویر است سازماندهی در روند اندازه گیریها در کارایی مثلث بندی هوایی مؤثر است. از امتیازات مطرح در فتوگرامتری رقومی انجام قدم به قدم تمام مراحل کار با استفاده از کامپیوتر می باشد. مشخصه اصلی مثلث بندی هوایی خودکار، در روش های ا...
متن کاملجداسازی خودکار کانی های موجود در مقاطع نازک سنگ ها با استفاده از الگوریتم های پردازش تصویر و خوشه بندی
جداسازی خودکار کانی های موجود در مقاطع نازک با استفاده از روشهای پردازش تصویر، یکی از موضوعاتی است که در سالهای اخیر مورد توجه زمین شناسان قرار گرفته است. سنگها اصلیترین منبع اطلاعاتی زمین شناسان میباشند، و یکی از روشهای متداول مطالعه سنگها، تهیه مقاطع نازک از آنها و بررسی این مقاطع با استفاده از میکروسکوپ های انکساری قطبی کننده نور است. همچنین جداسازی کانی های موجود در مقاطع نازک،...
متن کاملاستخراج خودکار جملات همتراز انگلیسی-فارسی از متون مقایسهای با بهرهبرداری از اطلاعات نحوی
پیکرههای موازی همواره از غنیترین منابع در مباحث پردازش زبان طبیعی محسوب میشوند. این نوع پیکرهها شامل متون ترجمهشدۀ دو یا چند زبان هستند که در سطوح مختلف کلمه، عبارت و یا جمله همترازشدهاند. علیرغم کاربرد فراوان این نوع پیکرهها در مطالعات مختلف از جمله پژوهشهای زبانی، ترجمة ماشینی آماری و سامانههای خودکار بازیابی اطلاعات میان زبانی، متأسفانه همواره پژوهشگران با کمبود پیکرههای موازی مو...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه بوعلی سینا - دانشکده مهندسی
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023